1 Introducción

2 Análisis de los métodos de enriquecimiento funcional

Términos totales Términos grandes %
ORA 202 67 33.17
GSEA 1604 128 7.98
elim 221 2 0.90
weight 159 2 1.26
PC 119 33 27.73
weight01 165 3 1.82

2.1 Resultados para ORA

2.1.1 Grafo

Grafo para los 20 términos más significativos de ORA. Abrir en nueva pestaña para ver en detalle.

2.1.2 Resultados

Enrichment plot de los 30 términos más significativos de ORA

2.1.3 Enrichment plot

2.2 Resultados para GSEA

2.2.1 Grafo

Grafo de los 20 términos más significativos para GSEA a mayor color mayor significancia. Los nodos rectangulares representan uno de los 20 términos. Abrir en nueva pestaña para ver en detalle.

2.2.2 Resultados

Enrichment plot de los 30 términos más significativos de GSEA

2.2.3 Enrichment Plot

2.3 Resultados para elim

2.3.1 Grafo

Grafo de los 10 términos más significativos para elim. A mayor color mayor significancia. Los nodos rectangulares representan uno de los 10 términos.

2.3.2 Resultados

Enrichment plot de los 30 términos más significativos de elim

2.3.3 Enriquecimiento

2.4 Resultados para weight

2.4.1 Grafo

Grafo de los 10 términos más significativos para weight. A mayor color mayor significancia. Los nodos rectangulares representan uno de los 10 términos. Abrir en nueva pestaña para ver en detalle.

2.4.2 Resultados

Enrichment plot de los 30 términos más significativos de weight

2.4.3 Enrichment Plot

2.5 Resultados para PC

2.5.1 Grafo

Grafo de los 20 términos más significativos para PC A mayor color mayor significancia. Los nodos rectangulares representan uno de los 20 términos. Abrir en nueva pestaña para ver en detalle.

2.5.2 Resultados

Enrichment plot de los 30 términos más significativos de PC

2.5.3 Enrichment Plot

2.6 Resultados para weight01

2.6.1 Grafo

Grafo de los 10 términos más significativos para weight01. A mayor color mayor significancia. Los nodos rectangulares representan uno de los 10 términos. Abrir en nueva pestaña para ver en detalle.

2.6.2 Resultados

Enrichment plot de los 30 términos más significativos de weight01

2.6.3 Enrichment Plot

2.7 Comparativas generales

2.7.1 Calidad de los términos y WSC

Tamaño medio para los términos significativos detectados por cada uno de los métodos

Distribución del IC detectado por cada método

Dichos términos redundantes presentan poco enriquecimiento y por tanto no son biológicamente tan relevantes. Para lidiar con ellos podemos hacer un proceso de filtrado o filtrado doble, y siempre previamente a la clusterizarión, pues de forma inversa la clusterización se vería sesgada por dichos términos.

El paso fundamental reside en la aplicación del WSC, que basándose en el pull total de genes de interés seleccionará aquellos términos con mejor p-valor que en conjunto representen a todo el pull de genes de interés. Este algoritmo no suele tener mucha potencia si se usa de forma aislada, sin embargo, si lo empleamos como una herramienta adicional para el filtrado previo a la clusterización vamos a conseguir una mejor calidad de los clusters. Pese a ello en nuestros datos existen aún términos generales que abarcan una gran cantidad de genes, de forma que alteran el funcionamiento de WSC y pueden afectar negativamente al resultado, por ello antes de aplicar WSC es buena idea eliminar todos aquellos términos con un tamaño superior a 1000 g/t, obteniendo los siguientes resultados.

Estandar
WSC
WSC + Filtrado
Nº Términos Enriquecimiento Nº Términos Enriquecimiento Nº Términos Enriquecimiento
Fisher 202 3.84 179 3.73 202 3.84
GSEA 1604 1.10 625 1.71 1604 1.10
elim 221 7.20 214 7.15 221 7.20
weight 159 7.52 154 7.48 159 7.52
PC 119 4.31 117 4.32 119 4.31
weight01 165 7.70 160 7.64 165 7.70

En la tabla superior vemos que si usamos WSC de forma aislada conseguimos descartar algunos términos para todos los métodos; principalmente GSEA que presenta una clara mejoría; sin embargo, su efecto no es muy destacable y en algunos casos incluso empeora el enriquecimiento medio. Al combinar WSC con un filtrado de los términos generales obtenemos unos mejores resultados en todos los casos, con un claro incremento de enriquecimiento en los métodos tradicionales y una sutil mejora en los métodos de control.

2.7.2 Medida PO

Utilizando el porcentaje de solapamiento (PO):

\[ (PO) = \bigg(\frac{\frac{k}{L_1}+\frac{k}{L_2}}{2}\bigg)*100 \]

Siendo k el número de términos compartidos por ambos métodos a comparar, L1 el número de términos del primer métodos y L2 los del segundo. Con ello podemos conocer cuantos términos comparten entre sí los distintos métodos.

Heatmap de las medidas PO para los 6 métodos de enriquecimiento funcional

2.7.3 Solapamiento de términos

Relación entre los términos de ORA, GSEA y PC

Relación entre los términos de elim, weight y weight01

Relación entre los 6 métodos de enriquecimiento

3 Clusterizado de los resultados

3.1 Resultados de ORA

3.1.1 Heatmaps

3.1.1.1 Heatmaps estandar

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.1.1.2 Heatmaps WSC

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.1.2 Tablas

3.1.2.1 Tabla estandar

Resultados del clusterizado para ORA
simplifyEnrichment REVIGO
> 20 términos 3 2
5-20 términos 6 12
< 5 términos 13 7
Tamaño medio 9 9
Total 22 21

3.1.2.2 Tabla WSC

Resultados del clusterizado para ORA
simplifyEnrichment REVIGO
> 20 términos 1 1
5-20 términos 4 7
< 5 términos 15 7
Tamaño medio 5 7
Total 20 15

3.1.3 Resultados

3.1.3.1 SE

Clusterizado mediante simplifyEnrichment para ORA

3.1.3.2 REVIGO

Clusterizado mediante REVIGO para ORA

3.1.3.3 SE - WSC

3.1.3.4 REVIGO - WSC

3.2 Resutados GSEA

3.2.1 Heatmaps

3.2.1.1 Heatmaps estandar

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.2.1.2 Heatmaps WSC

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.2.2 Tablas

3.2.2.1 Tabla estandar

Resultados del clusterizado para GSEA
simplifyEnrichment REVIGO
> 20 términos 12 24
5-20 términos 10 29
< 5 términos 21 26
Tamaño medio 37 20
Total 43 79

3.2.2.2 Tabla WSC

Resultados del clusterizado para ORA
simplifyEnrichment REVIGO
> 20 términos 10 7
5-20 términos 12 20
< 5 términos 36 20
Tamaño medio 8 10
Total 58 47

3.2.3 Resultados

3.2.3.1 SE

Clusterizado mediante simplifyEnrichment para GSEA

3.2.3.2 REVIGO

Clusterizado mediante REVIGO para GSEA

3.2.3.3 SE - WSC

3.2.3.4 REVIGO - WSC

3.3 Resultados elim

3.3.1 Heatmaps

3.3.1.1 Heatmaps estandar

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.3.1.2 Heatmaps WSC

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.3.2 Tablas

3.3.2.1 Tabla estandar

Resultados del clusterizado para elim
simplifyEnrichment REVIGO
> 20 términos 4 2
5-20 términos 4 11
< 5 términos 20 16
Tamaño medio 7 7
Total 28 29

3.3.2.2 Tabla WSC

Resultados del clusterizado para ORA
simplifyEnrichment REVIGO
> 20 términos 3 2
5-20 términos 7 11
< 5 términos 11 16
Tamaño medio 10 7
Total 21 29

3.3.3 Resultados

3.3.3.1 SE

Clusterizado mediante simplifyEnrichment para elim

3.3.3.2 REVIGO

Clusterizado mediante REVIGO para elim

3.3.3.3 SE - WSC

3.3.3.4 REVIGO - WSC

3.4 Resultados weight

3.4.1 Heatmaps

3.4.1.1 Heatmaps estandar

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.4.1.2 Heatmaps WSC

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.4.2 Tablas

3.4.2.1 Tabla estandar

Resultados del clusterizado para weight
simplifyEnrichment REVIGO
> 20 términos 3 0
5-20 términos 6 12
< 5 términos 10 15
Tamaño medio 8 5
Total 19 27

3.4.2.2 Tabla WSC

Resultados del clusterizado para ORA
simplifyEnrichment REVIGO
> 20 términos 2 0
5-20 términos 6 11
< 5 términos 12 16
Tamaño medio 7 5
Total 20 27

3.4.3 Resultados

3.4.3.1 SE

Clusterizado mediante simplifyEnrichment para weight

3.4.3.2 REVIGO

Clusterizado mediante REVIGO para weight

3.4.3.3 SE - WSC

3.4.3.4 REVIGO - WSC

3.5 Resultados PC

3.5.1 Heatmaps

3.5.1.1 Heatmaps estandar

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.5.1.2 Heatmaps WSC

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.5.2 Tablas

3.5.2.1 Tabla estandar

Resultados del clusterizado para weight
simplifyEnrichment REVIGO
> 20 términos 1 0
5-20 términos 5 5
< 5 términos 21 31
Tamaño medio 4 3
Total 27 36

3.5.2.2 Tabla WSC

Resultados del clusterizado para ORA
simplifyEnrichment REVIGO
> 20 términos 0 0
5-20 términos 4 4
< 5 términos 20 25
Tamaño medio 3 2
Total 24 29

3.5.3 Resultados

3.5.3.1 SE

Clusterizado mediante simplifyEnrichment para weight

3.5.3.2 REVIGO

Clusterizado mediante REVIGO para weight

3.5.3.3 SE - WSC

3.5.3.4 REVIGO - WSC

3.6 Resultados weight01

3.6.1 Heatmaps

3.6.1.1 Heatmaps estandar

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.6.1.2 Heatmaps WSC

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.6.2 Tablas

3.6.2.1 Tabla estandar

Resultados del clusterizado para weight01
simplifyEnrichment REVIGO
> 20 términos 3 0
5-20 términos 6 9
< 5 términos 14 20
Tamaño medio 7 5
Total 23 29

3.6.2.2 Tabla WSC

Resultados del clusterizado para ORA
simplifyEnrichment REVIGO
> 20 términos 2 0
5-20 términos 6 9
< 5 términos 12 20
Tamaño medio 7 5
Total 20 29

3.6.3 Resultados

Clusterizado mediante simplifyEnrichment para weight01

3.6.3.1 SE

3.6.3.2 REVIGO

Clusterizado mediante REVIGO para weight01

3.6.3.3 SE - WSC

3.6.3.4 REVIGO - WSC

4 Conclusiones

4.1 Número de clusters

4.1.1 Clusterizado estandar

4.1.2 Clusterizado con WSC

4.2 Distribución de clusters

4.2.1 Clusterizado estandar

4.2.2 Clusterizado con WSC

4.3 Tabla comparativa

4.3.1 Tabla estandar

IC medio Media de clusters Media de tamaño Total términos
ORA 4.335105 21.5 9.0 202
GSEA 4.852139 61.0 28.5 1604
elim 6.045344 28.5 7.0 221
weight 6.234965 23.0 6.5 159
PC 3.288544 31.5 3.5 119
weight01 6.315378 26.0 6.0 165

4.3.2 Tabla WSC

IC medio Media de clusters Media de tamaño Total términos
ORA 5.362366 17.5 6.0 202
GSEA 4.202345 52.5 9.0 1604
elim 5.883632 25.0 8.5 221
weight 6.312499 23.5 6.0 159
PC 3.747298 26.5 2.5 119
weight01 6.401812 24.5 6.0 165